热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

秘笈|CCASparkandHadoop考试心得

CCASparkandHadoop考试编码为CCA-175,就是2016年新出的开发者考试。众多小伙伴可能因试题是纯操作题的缘故,一直都没上战场。今儿有个考生这门认证考试竟然满分通

CCA Spark and Hadoop 考试编码为CCA-175,就是2016年新出的开发者考试。众多小伙伴可能因试题是纯操作题的缘故,一直都没上战场。今儿有个考生这门认证考试竟然满分通过,觉得记录下这历史性的时刻甚是必要:一千多字的考试心得啊!要备战的筒子们,赶紧吞了这袋血条吧!

一、考试内容

总计有10题,全部为实践操作题

1> 前五题分别为(sqoop,hive)

1).sqoop-import

2).sqoop-export,

3).hive创建表,并且将已经存在于hdfs上的表导入到新建表中

4).hive创建avro类型的表

5).hive创建一个分区表,并且导入数据

2> 6-9题为spark的python 和scala解析数据题目,考试模式为哪种原始的代码题空题目,不需要考试者从头到尾的完成所有代码,只需要填充那些缺失的代码部分,基本内容为加载hdfs上的数据,解析数据,过滤数据,排序,join数据,将处理后的数据存储到 hdfs上

3> 第10题,一个排错题,提供一个有错误的脚步去调试让脚步能够正常运行,

我考的这题是一个hive的avro表,查询时报错,修改该表的schame让查询能够正常运行(仅供大家参考)

4> 小结:从考试内容来看基本都是基础知识的考察,没有考察那些技巧性的内容和比较深奥的、偏门的知识(基本将培训的习题做做熟练基本能够通过考试)

二、考试环境
可以用一个“烂”字来形容

1> 考试环境可以用一个“烂”子来形容,字体小的需要贴着屏幕看,鼠标移动有较长的延迟,执行的速度一般。

2> 考试的环境是一远程的linux环境,全部英文,没有中文。

3> 考试中可以查看hive,sqoop等相关技术文档,在页面中已经明确的给出链接地址,直接点击即可。

4> 操作时”open in Terminal” 即可。

三、备考心得
将培训中的习题做熟练

1> 考试中未涉及 impala 和flume的内容。

2> 熟练掌握sqoop的导入导出,指定分隔符,指定文件存储类型。

3> 熟练掌握hive的ddl,创建数据库,创建外部表,创建表时指定分隔符,指定文件存储格式,指定文件位置,创建分区表,向分区表中导入数据。

4> 熟练掌握scala,python的基本语法。

5> 熟练掌握spark的rdd的相关基本操作,map,filter,join.mapValues,keyBy,sortByKey,textFile,saveAsTextFile等操作。

6> 熟练掌握count,collect,take等操作。

7> 能够熟练的解析文本,难度以习题难度为准,我初始准备时考试准备的难度偏难(解析复杂的文本,解析复杂的xml,解析复杂的json,而且去背各种import类路径和工具方法)但是从考试内容来看完全没有必要。

8> 考试时请做好时间安排,两个小时的时间很紧张,多半不够用,一旦在考试中出现各种exception多半会崩溃。

四、独门秘笈
节省考试时间的诀窍

1> 不建议打开太多的”open in Terminal”,最多不要超过3个,太多切换来切换去会晕。

2> 由于为实际操作题目,执行过的代码基本不能在找回,建议使用系统中自带的”Emacs”编辑器,编辑代码,存储代码,在此编辑器中编写好代码后在复制到命令行中运行,如果运行出错可以在进行修改。(建议在练习时熟练掌握emacs的常规使用方式,特别是“复制”和“粘帖”操作)

《秘笈 | CCA Spark and Hadoop考试心得》
《秘笈 | CCA Spark and Hadoop考试心得》

3> 使用”emacs”需要设置字体,系统的默认字体肉眼基本无法辨识,建议修改编辑器的字体大小

《秘笈 | CCA Spark and Hadoop考试心得》

4> 命令行的 字体也可以根据需要进行设置(我未设置,直接使用默认设置)

5> 在考试过程中要充分的使用复制和粘帖操作(如相关的路径信息,帐号信息,数据库表名,字段名称),以免自己的输入产生错误导致运行出错,而且可以节省。

五、考试成绩

考试完毕后大概30分钟后会收到邮件告知考试成绩

我考了两次:第一次由于环境的各种不熟悉和考试模式的不熟悉只做成功了5题,作为第5题时已经花去1个半小时,多半由于自己的输入失误导致出现各种错误,又由于怕代码丢失打开太多的窗口,所以在这里建议大家熟练使用emas编辑器,使用复制粘贴操作,不要打开太多的窗口。

第二次我吸取的第一次的教训大大提高了考试速度10题全部做完,顺利通过了考试。

以上内容为一点小小经验仅供参考,祝大家考试通过!


推荐阅读
  • 如何高效启动大数据应用之旅?
    在前一篇文章中,我探讨了大数据的定义及其与数据挖掘的区别。本文将重点介绍如何高效启动大数据应用项目,涵盖关键步骤和最佳实践,帮助读者快速踏上大数据之旅。 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 字节跳动深圳研发中心安全业务团队正在火热招募人才! ... [详细]
  • 本文介绍如何使用 Python 的 DOM 和 SAX 方法解析 XML 文件,并通过示例展示了如何动态创建数据库表和处理大量数据的实时插入。 ... [详细]
  • 从0到1搭建大数据平台
    从0到1搭建大数据平台 ... [详细]
  • 在 Ubuntu 中遇到 Samba 服务器故障时,尝试卸载并重新安装 Samba 发现配置文件未重新生成。本文介绍了解决该问题的方法。 ... [详细]
  • 您的数据库配置是否安全?DBSAT工具助您一臂之力!
    本文探讨了Oracle提供的免费工具DBSAT,该工具能够有效协助用户检测和优化数据库配置的安全性。通过全面的分析和报告,DBSAT帮助用户识别潜在的安全漏洞,并提供针对性的改进建议,确保数据库系统的稳定性和安全性。 ... [详细]
  • Python错误重试让多少开发者头疼?高效解决方案出炉
    ### 优化后的摘要在处理 Python 开发中的错误重试问题时,许多开发者常常感到困扰。为了应对这一挑战,`tenacity` 库提供了一种高效的解决方案。首先,通过 `pip install tenacity` 安装该库。使用时,可以通过简单的规则配置重试策略。例如,可以设置多个重试条件,使用 `|`(或)和 `&`(与)操作符组合不同的参数,从而实现灵活的错误重试机制。此外,`tenacity` 还支持自定义等待时间、重试次数和异常处理,为开发者提供了强大的工具来提高代码的健壮性和可靠性。 ... [详细]
  • 在分析和解决 Keepalived VIP 漂移故障的过程中,我们发现主备节点配置如下:主节点 IP 为 172.16.30.31,备份节点 IP 为 172.16.30.32,虚拟 IP 为 172.16.30.10。故障表现为监控系统显示 Keepalived 主节点状态异常,导致 VIP 漂移到备份节点。通过详细检查配置文件和日志,我们发现主节点上的 Keepalived 进程未能正常运行,最终通过优化配置和重启服务解决了该问题。此外,我们还增加了健康检查机制,以提高系统的稳定性和可靠性。 ... [详细]
  • 如何精通编程语言:全面指南与实用技巧
    如何精通编程语言:全面指南与实用技巧 ... [详细]
  • 深入解析 Python 中的 NumPy 加法函数 numpy.add() ... [详细]
  • 在过去,我曾使用过自建MySQL服务器中的MyISAM和InnoDB存储引擎(也曾尝试过Memory引擎)。今年初,我开始转向阿里云的关系型数据库服务,并深入研究了其高效的压缩存储引擎TokuDB。TokuDB在数据压缩和处理大规模数据集方面表现出色,显著提升了存储效率和查询性能。通过实际应用,我发现TokuDB不仅能够有效减少存储成本,还能显著提高数据处理速度,特别适用于高并发和大数据量的场景。 ... [详细]
  • 在第二课中,我们将深入探讨Scala的面向对象编程核心概念及其在Spark源码中的应用。首先,通过详细的实战案例,全面解析Scala中的类和对象。作为一门纯面向对象的语言,Scala的类设计和对象使用是理解其面向对象特性的关键。此外,我们还将介绍如何通过阅读Spark源码来进一步巩固对这些概念的理解。这不仅有助于提升编程技能,还能为后续的高级应用开发打下坚实的基础。 ... [详细]
  • 当前,众多初创企业对全栈工程师的需求日益增长,但市场中却存在大量所谓的“伪全栈工程师”,尤其是那些仅掌握了Node.js技能的前端开发人员。本文旨在深入探讨全栈工程师在现代技术生态中的真实角色与价值,澄清对这一角色的误解,并强调真正的全栈工程师应具备全面的技术栈和综合解决问题的能力。 ... [详细]
  • window下的python安装插件,Go语言社区,Golang程序员人脉社 ... [详细]
author-avatar
涂凌萱_TLX_9s7_140
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有